[TD1] Introduction à l’analyse spatiale
Masters Géoprisme et Carthageo
Ce support de cours a été créé pour la session 2025-26 du cours d’analyse spatiale des phénomènes sociaux destiné aux étudiants de géographie des universités Paris Cité et Paris 1 Panthéon-Sorbonne
EXO1 : MESURER LA CONCENTRATION SPATIALE
Mise en place
On considère un monde composé de 48 positions spatiales, chacune d’entre elle étant occupée par une carte à jouer d’un jeu de 52 cartes dont on a retiré les rois. Cinq tirages différents ont été effectués au hasard.
On choisit l’un des cinq jeux comme monde et on le visualise:
Nous avons quatre familles d’individus correspondant à Pique, Coeur, Carreau et Trèfle. Proposez une méthode pour répondre à laquestion
Laquelle est la plus concentrée spatialement ? La plus dispersée ?
Solution 1 : Point moyen, distance-type et ellipse de dispersion
Vous avez normalement appris en licence quelques bases de statistique spatiale. Celle-ci propose notamment de calculer pour chaque distribution de points de coordonnées \((X_i,Y_i)\) le centre de gravité \(G(X_g,Y_g)\)
\(X_g = \frac{\Sigma_{i=1}^n{X_i}}{n}\)
\(Y_g = \frac{\Sigma_{i=1}^n{X_i}}{n}\)
On peut ensuite calculer l’écart-type de \(X\) et \(Y\) :
\(\sigma_X = \frac{\Sigma_{i=1}^n{(X_i-X_g)^2}}{n-1}\)
\(\sigma_Y = \frac{\Sigma_{i=1}^n{(Y_i-Y_g)^2}}{n-1}\)
Et finalement en déduire la distance-type \(\sigma_{X,Y}\) de chaque point au centre de gravité par la formule :
\(\sigma_{X,Y} = \sqrt{\sigma_X^2+\sigma_Y^2}\)
Passons au calcul dans R. Il suffit pour cela d’utiliser la fonction moyenne (mean) et la fonction écart-type (sd) en les combinant avec la fonction tapply() qui permet d’effectuer le calcul par sous-tableaux en fonction de la variable décrivant la famille des cartes.
| Xg | Yg | X_ect | Y_ect | D_type | |
|---|---|---|---|---|---|
| ♠ | 3.33 | 2.92 | 1.80 | 1.93 | 2.64 |
| ♣ | 3.17 | 4.67 | 1.87 | 2.48 | 3.11 |
| ♥ | 2.08 | 4.25 | 1.68 | 2.45 | 2.97 |
| ♦ | 3.42 | 4.17 | 1.38 | 2.27 | 2.66 |
On déduit facilement du tableau précédent la distribution la plus dispersée et la moins dispersée.
On peut ensuite visualiser le résultat à l’aide d’ellipses de dispersions qui permettent de repérer à la fois le centre de gravité et les zones de localisation les plus probables des points. Sans entrer dans les détails mathématiques, on peut voir ci-dessous comment les ellipses de dispersion correspondant aux intervalles de confiance 25%, 50% et 75% sont plus ou moins étendues.
- Discussion : La solution précédente est relativement complexe puisqu’elle fait appel à des notions statistiques pas forcément connues. Mais surtout elle comporte des hypothèses implicites concernant la distribution spatiale et l’éloignement des points. Elle se place en effet dans un espace euclidien continu et suppose que les distributions de X et de Y sont de nature gaussienne. Or rien n’indique que ces deux hypothèses soient valides !
Solution 2 : Distances et métriques
Supposons maintenant que l’on ne puisse pas se déplacer dans n’importe quelle direction mais seulement horizontalement et verticalement en passant d’un carreau au carreau voisin. On se trouve alors dans un espace ayant une géométrie particulière telle que la distance entre deux points est une distance rectilinéaire aussi appelée distance de Manhattan ou distance city-block :
\(D_{ij} = |X_i-X_j| + |Y_i-Y_j|\)
Examinons la distribution des individus de la famille “Pique” :
On construit un repère orthonormé où le point situé en bas à gauche correspond à l’origine \((0,0)\) et où chaque carreau a un côté de longueur 1. On en déduit les coordonnées de chacune des cartes de la famille en supposant qu’elles sont placées au centre de leur carreau :
| cards | X | Y | |
|---|---|---|---|
| 3 | 4♠ | 5.5 | 0.5 |
| 4 | 5♠ | 0.5 | 1.5 |
| 8 | 9♠ | 1.5 | 1.5 |
| 11 | D♠ | 2.5 | 1.5 |
| 6 | 7♠ | 4.5 | 1.5 |
| 9 | 10♠ | 5.5 | 1.5 |
| 2 | 3♠ | 1.5 | 2.5 |
| 5 | 6♠ | 5.5 | 3.5 |
| 13 | A♠ | 3.5 | 4.5 |
| 10 | V♠ | 4.5 | 4.5 |
| 1 | 2♠ | 1.5 | 5.5 |
| 7 | 8♠ | 3.5 | 6.5 |
On en déduit la matrice de distance suivante :
4♠ 5♠ 9♠ D♠ 7♠ 10♠ 3♠ 6♠ A♠ V♠ 2♠ 8♠
4♠ NA 6 5 4 2 1 6 3 6 5 9 8
5♠ 6 NA 1 2 4 5 2 7 6 7 5 8
9♠ 5 1 NA 1 3 4 1 6 5 6 4 7
D♠ 4 2 1 NA 2 3 2 5 4 5 5 6
7♠ 2 4 3 2 NA 1 4 3 4 3 7 6
10♠ 1 5 4 3 1 NA 5 2 5 4 8 7
3♠ 6 2 1 2 4 5 NA 5 4 5 3 6
6♠ 3 7 6 5 3 2 5 NA 3 2 6 5
A♠ 6 6 5 4 4 5 4 3 NA 1 3 2
V♠ 5 7 6 5 3 4 5 2 1 NA 4 3
2♠ 9 5 4 5 7 8 3 6 3 4 NA 3
8♠ 8 8 7 6 6 7 6 5 2 3 3 NA
Il est alors facile de calculer les paramètres de la distribution des distances entre deux individus différents de la famille pique. Il suffit de retirer du calcul la diagonale et de procéder à un résumé statistique des \(12x11 = 132\) distances entre les paires d’individus composant cette famille.
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
1.000 3.000 4.000 4.318 6.000 9.000 12
On peut également déterminer combien de paires d’individus sont voisins (situées dans des cases voisines).
FALSE TRUE
120 12
Et plus généralement on peut calculer la forme de la distribution des distances entre paires d’individus afin de déterminer la distance modale qui est le cas le plus fréquent.
- Discussion : Nous avons désormais une famille de solutions plus simples et plus concrètes pour mesurer la concentration. Mais quelle solution retenir pour comparer entre elles les familles : distance moyenne, distance médiane, distance modale, distance minimale, distance maximale … Comme le montre bien la figure précédente, la distribution des distances entre les paires d’individus peut faire l’objet de résumés très différents et il n’existe pas de solution unique. On peut en effet imaginer le cas de distributions concentrées localement et dispersées globalement.
Considérez l’exemple suivant.
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
1.000 4.000 6.000 5.798 8.250 12.000 16
- Commentaire : cette distribution est globalement plus dispersée que la précédente puisque la distance moyenne entre deux individus est de 5.86 contre 4.32. Mais elle est localement plus concentrée puisque chaque individu a systématiquement deux voisins
Solution 3 : Graphe et composantes connexes
Une troisième solution (qui devrait rappeler les règles du jeu de go à ceux qui le connaissent) consiste à déterminer le degré de fragmentation de chaque famille en composantes connexes. On considère désormais que deux individus d’une même famille sont reliés s’il existe un chemin les reliant qui ne passe que par des membres de la même famille. On va donc définir un graphe de voisinage entre les cellules et considérer que la relation est possible si des membres de la même famille se trouvent de part et d’autre.
Ceci revient à déterminer toutes les paires contigües \((C_{ij}=1)\) puis à vérifier si elles relie des individus similaires \((S_{ij}=1)\) pour déterminer si la relation entre eux est possible \((R_{ij}=1)\). On trouve 34 paires orientées soit 17 paires symétriques vérifiant les conditions.
| i | j | Cij | Sij | Rij |
|---|---|---|---|---|
| D♥ | A♥ | 1 | 1 | 1 |
| 9♠ | 5♠ | 1 | 1 | 1 |
| D♠ | 9♠ | 1 | 1 | 1 |
| 9♠ | 3♠ | 1 | 1 | 1 |
| 4♦ | 3♦ | 1 | 1 | 1 |
| D♦ | 3♦ | 1 | 1 | 1 |
| 9♥ | 4♥ | 1 | 1 | 1 |
| V♦ | A♦ | 1 | 1 | 1 |
| 6♣ | 3♣ | 1 | 1 | 1 |
| 9♥ | 2♥ | 1 | 1 | 1 |
| 3♥ | 2♥ | 1 | 1 | 1 |
| V♠ | A♠ | 1 | 1 | 1 |
| 9♣ | 4♣ | 1 | 1 | 1 |
| 5♣ | 4♣ | 1 | 1 | 1 |
| V♥ | 6♥ | 1 | 1 | 1 |
| 7♥ | 6♥ | 1 | 1 | 1 |
| 7♦ | 2♦ | 1 | 1 | 1 |
On peut alors déterminer la famille qui dispose du plus grand nombre de relations de voisinage avec des membres de sa famille :
♠ ♣ ♥ ♦
4 3 6 4
On peut visualiser ce résultat sous la forme d’un graphe :
EXO2 : DYNAMIQUES DE SEGREGATION ET D’OPINION
Mise en place
Une quarantaine d’étudiants entrent dans une salle de cours comportant 6 rangées de 8 chaises. Sans dire un mot, les enseignants leurs remettent silencieusement une carte à jouer tiré d’un jeu de 52 cartes d’où les rois ont été retirés et leurs demandent de s’installer. Les enseignants procèdent à l’appel en suivant l’ordre des rangées et chaque étudiant indique la carte à jour qui lui a été attribuée, tandis que l’enseignant lui indique sa position spatiale :
- Etudiant : Je suis Albert Dupont et ma carte est le 8 de Pique.
- Enseignant : Vous occupez la place C07.
Après avoir saisi la position de tous les étudiants, les enseigants effectuent quelques manipulations sur leur ordinateur et affichent la carte suivante à l’écran.
Le modèle d’Axelrod
Détermination des voisins
On détermine pour chaque cellule occupée par un individu la liste de ses voisins en notant leur couleur :
i j Rij coli colj
1 C00 C00 0 black black
2 C00 C10 1 black red
3 C02 C02 0 red red
4 C02 C03 1 red red
5 C02 C12 1 red black
6 C03 C02 1 red red
7 C03 C03 0 red red
8 C03 C04 1 red black
9 C03 C13 1 red red
10 C04 C03 1 black red
- Exemple L’individu qui occupe la case C00 est noir et il possède un unique voisin rouge en C10. L’individu qui occupe la case C02 est rouge et il possède un voisin rouge et un voisin noir. L’individu qui occupe la case C03 est rouge avec deux voisins rouges et un voisin noir…
Règle de changement
On adopte la règle du modèle d’Axelrod (qui est plus complexe que celui-ci) en supposant que chaque individu réalise au cours de chaque round une interaction tirée au hasard entre la sienne et celle de ses voisins et adopte cette opinion. Par exemple :
- l’individu situé en C00 est rouge avec un voisin noir. Il a donc 50% de chances de garder son opinion initiale (noir) et 50% celle de choisir l’opinion de son voisin (rouge).
- l’individu situé en C02 est rouge avec un voisin rouge et un voisin noir. Il a donc 67% de chances de rester rouge et 33% de devenir noir.
- l’individu situé en C03 est rouge avec deux voisins rouges et un voisin noir. Il a donc 75% de chances de rester rouge et 25% de devenir noir.
On voit donc que dans ce modèle, les individus ont une opinion qui varie en fonction de leur opinion initiale et de celle de leur voisin. Ils ont d’autant plus de chances de garder leur opinion qu’ils sont entourés d’individus ayant la même opinion. Et inversement d’autant moins de chance qu’ils sont entourés d’individus ayant des opinions différentes.
Simulation de la dynamique
l’exercice est à faire en classe avec les étudiants. Mais on peut donner ici un exemple de résultat.